#####################################################################################################################################################
# Script: Naturalisatie en integratie: herkomstland nader bekeken                                                                                   #
# Floris Peters, Hans Schmeets & Maarten Vink                                                                                                       #
# Published in H. Schmeets (Ed.), Sociale samenhang: wat ons bindt en verdeelt. Cenraal Bureau voor de Statistiek: 150-168. ISBN: 978-90-357-1618-6 #                        
#####################################################################################################################################################


################
# Introduction #
################

# This file provides the syntax used to create all the tables and figures in the paper. 
# The dataset contains sensitive, micro level information. As such, for privacy reasons the data is only available to individuals employed at or affiliated to Statistics Netherlands. 
# The dataset can be found at the following location on the network of Statistics Netherlands: \\cbsp.nl\Productie\Projecten\SAL\209253UM_FP_SEC1\Werk\Floris\PhD\CBS_naturalisation_origin

#######################################################################################################################
#######################################################################################################################

#############
# Variables #
#############

# NATURALISATIE
# (bezit Nederlandse nationaliteit)
# [0] Nee; 
# [1] Ja

# START
# (Begin tijd vector)

# STOP
# (Einde tijd vector)

# GESLACHT
# [1] Man; 
# [2] Vrouw

# LFT_MIGR 
# (Leeftijd op het moment van migratie) 

# HERKOMSTLAND 
# (Herkomstland/regio van persoon met migratieachtergrond) 

# HDI 
# (Human Development Index score herkomstland) 

# HDI_Q 
# (Human Development Index score herkomstland in kwartielen) 

# KAUFMANN 
# (Kaufmann index score herkomstland) 

# KAUFMANN_Q 
# (Kaufmann index score herkomstland in kwartielen) 

# EU
# (EU lidmaatschap herkomstland)
# [0] Nee; 
# [1] Ja

# DUBBELNAT
# (Dubbele nationaliteitswetgeving herkomstland)
# [0] Geen automatisch verlies; 
# [1] Automatisch verlies

# PARTNER
# (Geregistreerde partner)
# [0] Nee; 
# [1] Ja

# Kind
# (Minderjarig kind in het huishouden)
# [0] Nee; 
# [1] Ja

#######################################################################################################################
#######################################################################################################################

#laad packages
library(ggplot2)
library(MASS)
library(dotwhisker)
library(dplyr)
library(lattice)
library(gridExtra)
library(grid)

#laad dataset
data_naturalisatie <- read.csv(file.choose(),header=T,sep=";")


################     
# Table 12.3.1 #
################  

#beschrijvende statistieken naturalisatie
prop.table(table(data_naturalisatie$GESLACHT,data_naturalisatie$NATURALISATIE),1)
prop.table(table(data_naturalisatie$HDI_Q,data_naturalisatie$NATURALISATIE),1)
prop.table(table(data_naturalisatie$KAUFMANN_Q,data_naturalisatie$NATURALISATIE),1)
prop.table(table(data_naturalisatie$EU,data_naturalisatie$NATURALISATIE),1)
prop.table(table(data_naturalisatie$DUBBELNAT,data_naturalisatie$NATURALISATIE),1)
prop.table(data_naturalisatie$NATURALISATIE)


################     
# Table 12.3.2 #
################

#bepaal survival functie
data_naturalisatie$surv_12.3.2 <- Surv(data_naturalisatie$START, data_naturalisatie$STOP, data_naturalisatie$NATURALISATIE)

#cox regressie
resultaat_12.3.2 <- coxph(surv_12.3.2 ~ GESLACHT + HDI + KAUFMANN + EU + DUBBELNAT + LFT_MIGR + PARTNER + KIND, data = data_naturalisatie)

#specificeer subsets hdi en kaufmann kwartielen
data_naturalisatie_HDI_Q1 <- subset(data_naturalisatie, HDI_Q == 1)
data_naturalisatie_HDI_Q2 <- subset(data_naturalisatie, HDI_Q == 2)
data_naturalisatie_HDI_Q3 <- subset(data_naturalisatie, HDI_Q == 3)
data_naturalisatie_HDI_Q4 <- subset(data_naturalisatie, HDI_Q == 4)
data_naturalisatie_KAUFMANN_Q1 <- subset(data_naturalisatie, KAUFMANN_Q == 1)
data_naturalisatie_KAUFMANN_Q2 <- subset(data_naturalisatie, KAUFMANN_Q == 2)
data_naturalisatie_KAUFMANN_Q3 <- subset(data_naturalisatie, KAUFMANN_Q == 3)
data_naturalisatie_KAUFMANN_Q4 <- subset(data_naturalisatie, KAUFMANN_Q == 4)


#################     
# Table 12.3.3a #
#################

table(data_naturalisatie_HDI_Q1$HERKOMSTLAND)
table(data_naturalisatie_HDI_Q1$HERKOMSTLAND,data_naturalisatie_HDI_Q1$NATUARLISATIE)
prop.table(table(data_naturalisatie_HDI_Q1$HERKOMSTLAND,data_naturalisatie_HDI_Q1$NATUARLISATIE),1)


#################     
# Table 12.3.3b #
#################

table(data_naturalisatie_HDI_Q2$HERKOMSTLAND)
table(data_naturalisatie_HDI_Q2$HERKOMSTLAND,data_naturalisatie_HDI_Q2$NATUARLISATIE)
prop.table(table(data_naturalisatie_HDI_Q2$HERKOMSTLAND,data_naturalisatie_HDI_Q2$NATUARLISATIE),1)


#################     
# Table 12.3.3c #
#################

table(data_naturalisatie_HDI_Q3$HERKOMSTLAND)
table(data_naturalisatie_HDI_Q3$HERKOMSTLAND,data_naturalisatie_HDI_Q3$NATUARLISATIE)
prop.table(table(data_naturalisatie_HDI_Q3$HERKOMSTLAND,data_naturalisatie_HDI_Q3$NATUARLISATIE),1)


#################     
# Table 12.3.3d #
#################

table(data_naturalisatie_HDI_Q4$HERKOMSTLAND)
table(data_naturalisatie_HDI_Q4$HERKOMSTLAND,data_naturalisatie_HDI_Q4$NATUARLISATIE)
prop.table(table(data_naturalisatie_HDI_Q4$HERKOMSTLAND,data_naturalisatie_HDI_Q4$NATUARLISATIE),1)


#################     
# Table 12.3.4a #
#################

table(data_naturalisatie_KAUFMANN_Q1$HERKOMSTLAND)
table(data_naturalisatie_KAUFMANN_Q1$HERKOMSTLAND,data_naturalisatie_KAUFMANN_Q1$NATUARLISATIE)
prop.table(table(data_naturalisatie_KAUFMANN_Q1$HERKOMSTLAND,data_naturalisatie_KAUFMANN_Q1$NATUARLISATIE),1)


#################     
# Table 12.3.4b #
#################

table(data_naturalisatie_KAUFMANN_Q2$HERKOMSTLAND)
table(data_naturalisatie_KAUFMANN_Q2$HERKOMSTLAND,data_naturalisatie_KAUFMANN_Q2$NATUARLISATIE)
prop.table(table(data_naturalisatie_KAUFMANN_Q2$HERKOMSTLAND,data_naturalisatie_KAUFMANN_Q2$NATUARLISATIE),1)


#################     
# Table 12.3.4c #
#################

table(data_naturalisatie_KAUFMANN_Q3$HERKOMSTLAND)
table(data_naturalisatie_KAUFMANN_Q3$HERKOMSTLAND,data_naturalisatie_KAUFMANN_Q3$NATUARLISATIE)
prop.table(table(data_naturalisatie_KAUFMANN_Q3$HERKOMSTLAND,data_naturalisatie_KAUFMANN_Q3$NATUARLISATIE),1)

#################     
# Table 12.3.4d #
#################

table(data_naturalisatie_KAUFMANN_Q4$HERKOMSTLAND)
table(data_naturalisatie_KAUFMANN_Q4$HERKOMSTLAND,data_naturalisatie_KAUFMANN_Q4$NATUARLISATIE)
prop.table(table(data_naturalisatie_KAUFMANN_Q4$HERKOMSTLAND,data_naturalisatie_KAUFMANN_Q4$NATUARLISATIE),1)
